Estado actual del filtrado de bots
-
Actualmente filtramos los user-agents de bots comunes de nuestros datos
-
Estos user-agents fluirán a través de su embudo como de costumbre y el seguimiento funciona normalmente. Sin embargo, eliminamos los datos en nuestro proceso antes de que lleguen a la base de datos, haciendo que no aparezcan en los informes
-
También filtramos ciertas visitas a medida que surgen situaciones (por ejemplo, solicitudes extrañas pero prevalentes)
-
También descartamos los datos de costos entrantes si el valor pasado es demasiado alto
-
En este momento, no hay un filtro a nivel de usuario para agregar sus propias reglas de exclusión o bloqueo de bots
Planes generales de la función de filtrado de bots
Planeamos agregar la capacidad de crear reglas que sean globales, o que se apliquen solo a embudos específicos, o solo a fuentes de tráfico específicas. Nuestros planes son los siguientes:
- Proporcionar reglas de filtrado como una nueva sección, donde defina reglas globales (a nivel de cuenta) basadas en:
- User-agent
- Dirección IP/rangos
- Dominio/ruta del referente
- Países
- Nombre del ISP
- Embudo
- Fuente de tráfico
- Entonces podrá aplicar varias acciones:
- Marcar como filtrado pero dejar que el visitante continúe normalmente por la ruta del embudo
- No registrar los datos, pero dejar que el visitante continúe normalmente por la ruta del embudo
- Rebotar el tráfico a una URL específica y no registrar los datos en absoluto
Así que estas acciones son básicamente suave, eliminación suave y rebote duro.
¡Pero eso es para el futuro! Pasemos a lidiar con el presente...
Lidiando con bots usando reinicios de datos
En este momento, hemos agregado algunos filtros básicos de nuestra parte para deshacernos de los bots conocidos.
Si tiene otro tráfico del que quiere deshacerse, lo único que puede hacer con los datos molestos es eliminarlos por completo.
Puede hacer esto a través de la sección de actualizaciones > reiniciar estadísticas. La forma más fácil será conocer las IP del tráfico que desea eliminar.
Luego puede elegir grupos de embudos, embudos y fuentes de tráfico (o simplemente seleccionar todo), luego activar el filtrado de IP e ingresar IP/rangos, así:
Haga clic en Estimar y encontrará datos coincidentes, que luego puede eliminar.
¿Cómo encontrar estas IP? Para eso, puede usar nuestra sección de Eventos Brutos y simplemente escanear los resultados. Típicamente encontrará ISP específicos, referentes o user-agents responsables de la basura que desea eliminar.
Puede encontrar y copiar manualmente las IP relacionadas, o exportar a Excel y filtrar para obtener lo que desea allí.
Por ahora, yo simplemente mantendría un archivo de texto con las IP/rangos para que pueda copiar/pegar en el formulario anterior cada vez que quiera hacer esto, y así pueda hacer crecer su lista de filtrado con el tiempo -- básicamente una lista negra de IP.
Planeamos agregar el user-agent y el nombre del ISP a las opciones de filtrado anteriores en el futuro, lo que puede hacer que esto sea aún más fácil, antes de nuestro módulo de filtrado.
¡Disculpe las molestias!
Además, tenga en cuenta que las operaciones de reinicio de estadísticas son lentas -- una vez enviadas van a nuestra base de datos que gestiona estas operaciones por sí misma, está fuera de nuestro control. Así que puede tomar 15 segundos, puede tomar 10 minutos -- solo necesita esperar y dejar que proceda.
Si después de 1 hora sus datos no han sido eliminados, puede intentar nuevamente y ver si la estimación ha cambiado, o contactarnos para obtener ayuda.